Спецкурс	MаLы DаLи

Основная информация

№	Пункт		Содержание
1	Направление		Третий Путь
2	Класс		10 - 11
3	Тип курса		зачётный только для 10-11-ти классников
4	Преподаватели		Куратцев Владимир, Кадерова Надия
5	Стажёры
6	Время проведения		Среда 18:55 - 20:15
7	Цель курса		Познакомить школьников с основами науки о данных (Data Science) и научить применять знания на практике с конкретными типами задач из Machine Learning и Deep Learning
8	Задачи курса		1. Дать общее представление об истории Data Science 2. Познакомить с основами Python для Data Science 3. Познакомить с основами Data Science (ML,DL) 4. Познакомить с разными типами задач и примерами их решения 5. Дать возможность самостоятельной реализации задач и проектов по Data Science с поддержкой преподавателей
9	Особенности курса		Адаптированный для школьников курс по Data Science (Machine Learning и Deep Learning). Возможность практики на конкретных задачах и реализации своего проекта с поддержкой преподавателей. Для прохождения курса необходимо наличие дома доступа к компьютеру и интернету. По желанию школьников можно приносить на занятия ноутбук для отработки навыков параллельно лекции
10	Формат проведения занятия (включая использование classroom)		1) Совмещенный формат: лекция + семинар. Лекционный материал от преподавателя, разбор кода и параллельное его написание школьниками в компьютерном классе; 2) Особые виды занятий (экзамен или чаепитие)
11	Целевая аудитория		Школьники 10-11 классов, заинтересованные в изучении Data Science и имеющие уверенные знания в математике и программировании
12	Краткое описание курса		Адаптированный для школьников 10-11 классов курс науки о данных (Data Science)
13	Количество слушателей		от 10 до 20 человек
14	Отбор		Отбор будет. Письменная работа из задач по математике, информатике, программированию. Задания не привязаны к конкретному языку программированию
15	Формы контроля и система отчётности		1. Посещение - 20% 2. Домашняя работа (мини-задачи для практики на основе пройденного материала) - 30% 3. Письменный экзамен - 20% 4. Проект (самостоятельная практическая работа, посвященная решению одного из разобранных на лекциях типов задач на конкретном примере данных) - 30%
16	Формат курса: онлайн/оффлайн/гибрид. В случае онлайн, какие платформы используются?		оффлайн
20	Дополнительная информация о курсе

Позанятийный план

№ занятия	Дата (Среда)	Тематический блок	План занятия
1	02.10.2024	Введение. Отбор.	Обсуждение организационных вопросов. Проведение отбора.
2	09.10.2024	Введение	Введение в историю науки о данных, ее структура и методы.
3	16.10.2024	Python	Вводное занятие по программированию. Организация работы в компьютерном классе. Google Collab. Anaconda и Jupiter Notebook. Работа с нейросетью (например, Phind, GigaChat) для помощи с написанием кода.
4	23.10.2024	Python	Основы синтаксиса. Переменные и типы данных. Математические операции.
5	30.10.2024	Python	Основные структуры: условные конструкции, циклы и функции. Библиотека pandas. Предобработка данных: работа с пропусками.
6	06.11.2024	Python	Предобработка данных: работа с типами данных, дубликатами. Библиотека matplotlib. Основы визуализации данных.
7	13.11.2024	Элементы математической статистики	Введение в статистику: вероятность, случайные величины и их распределения, математическое ожидание, дисперсия, медиана, ковариация, корреляция, регрессия.
8	20.11.2024	Элементы математической статистики	Выборочные характеристики, точечные оценки и их свойства. Методы построения оценок: ММ, ММП, МНК.
9	27.11.2024	Машинное обучение	Введение в машинное обучение. Задача регрессии. Библиотека scikit-learn. Разбиение данных на выборки. Линейная регрессия. Оценка качества модели регрессии.
10	04.12.2024	Машинное обучение	Обработка количественных и категориальных признаков. Анализ ошибок модели. Дедлайн №1 по выбору задачи.
11	11.12.2024	Машинное обучение	Задача классификации. Логистическая регрессия. Оценка качества модели классификации. Дедлайн №2 по структуре проекта.
12	18.12.2024	Машинное обучение	Метод опорных векторов. Дерево решений. Дедлайн №3 по коду проекта.
13	25.12.2024	Машинное обучение	Переобучение и недообучение. Регуляризация. Решения проблемы дисбаланса классов. Кросс-валидация. Дедлайн №4 по результатам.
	01.01.2025	-
	08.01.2025	-
14	15.01.2025	Экзамен	Защита проекта (выступление с презентацией) и письменный экзамен
15	22.01.2025	Чаепитие	Чаепитие
16	29.01.2025	Машинное обучение	Задача понижения размерности. Проклятие размерности. Метод главных компонент. t-SNE.
17	05.02.2025	Машинное обучение	Задача кластеризации. Сложности постановки задачи. Метод K-Means.
18	12.02.2025	Машинное обучение	Иеархическая кластеризация. DBSCAN.
	19.02.2025	-
19	26.02.2025	Глубокое обучение	Введение в нейронные сети. Структура нейрона. Определение нейронной сети. Виды нейронных сетей. Полносвязные нейронные сети.
20	05.03.2025	Глубокое обучение	Сверточные нейронные сети (CNN). Архитектура CNN. Введение в библиотеку PyTorch. Решение задачи классификации с помощью нейронных сетей.
21	12.03.2025	Глубокое обучение	Реализация CNN для задачи классификации в выбранном фреймворке. Оценка модели.
22	19.03.2025	Глубокое обучение	Задача распознавания звуков. Особенности и характерные признаки. Принцип работы CNN при обработке аудиоданных.
23	26.03.2025	Глубокое обучение	Реализация CNN для задачи распознавания звуков в выбранном фреймворке. Оценка модели. Эксперименты с различными параметрами. Дедлайн №1 по выбору задачи.
24	02.04.2025	Глубокое обучение	Структура нейронной сети для задачи регрессии. Роль активационных функций. Описание архитектур для регрессии. Применение выбранной модели для решения задачи регрессии. Оценка точности и других метрик качества. Дедлайн №2 по структуре проекта.
25	09.04.2025	Глубокое обучение	Определение временного ряда. Основные статистические характеристики временных рядов. Реккурентные нейронные сети. Принцип работы, особенности и преимущества. Применение обученной нейронной сети для прогнозирования временного ряда. Оценка производительности модели и сравнение со статистическими методами. Дедлайн №3 по коду проекта.
26	16.04.2025	Глубокое обучение	Определение автоэнкодера. Назначение автоэнкодера. Архитектура автоэнкодера. Метрики оценки качества сжатия. Примеры использования автоэнкодеров для сжатия изображений. Дедлайн №4 по результатам.
27	23.04.2025	Глубокое обучение	Защита проекта (выступление с презентацией) и письменный экзамен
28	30.04.2025	Глубокое обучение	Чаепитие
	07.05.2025
	14.05.2025
	21.05.2025
	28.05.2025
	04.06.2025
	11.06.2025
	18.06.2025
	25.06.2025

Список используемой и рекомендованной литературы

1	Билл Л. Простой Python. Современный стиль программирования.
2	Брантон С. Л., Куц Д. Н. Анализ данных в науке и технике.
3	Дайзенрот М. и др. Математика в машинном обучении.
4	Джоэл Г. Data Science: Наука о данных с нуля.
5	Кадурин А., Николенко С., Архангельская Е. Глубокое обучение. Погружение в мир нейронных сетей.
6	Коул и др. Искусственный интеллект и компьютерное зрение. Реальные проекты на Python, Keras и TensorFlow.
7	Мюллер, Массарон: Глубокое обучение для чайников.
8	Савельев В. Статистика и котики.
9	Фостер Д. Генеративное глубокое обучение. Как не мы рисуем картины, пишем романы и музыку.
10	https://pythontutor.com/
11	https://www.codecamp.ru/tag/pythontuts/
12	https://education.yandex.ru/handbook